Modèle de langue visuel pour la reconnaissance de scènes

نویسندگان

  • Trong-Ton Pham
  • Loïc Maisonnasse
  • Philippe Mulhem
  • Éric Gaussier
چکیده

We describe here a method to use a graph language modeling approach for image retrieval and image categorization. Since photographic images are 2D data, we first use image regions (mapped to automatically induced concepts) and then spatial relationships between these regions to build a complete image graph representation. Our method deals with different scenarios, where isolated images or groups of images are used for training or testing. The results obtained on an image categorization problem show (a) that the procedure to automatically induce concepts from an image is effective, and (b) that the use of spatial relationships, in addition to concepts, for representing an image content helps improve the classifier accuracy. This approach extends the language modeling approach to information retrieval to the problem of graph-based image retrieval and categorization, without considering image annotations. MOTS-CLÉS : Représentation de graphes, recherche d’image, catégorisation d’image

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Forme, Image, Mouvement : Vers Un Art Du Mouvement Visuel

Nous montrons tout d’abord en quoi le paradigme de la modélisation physique particulaire masses / interactions présente deux propriétés essentielles nécessaires à un outil de création informatique pour le mouvement visuel : la généricité et la modularité. Puis, nous abordons trois questions fondamentales liées aux conditions technologiques et théoriques pour l’émergence d’un art du mouvement vi...

متن کامل

Modèle de graphe et modèle de langue pour la reconnaissance de scènes visuelles

We describe here a method to use a language modeling approach for image retrieval and image categorization. Since photographic images are 2D data, we first use image regions (mapped to automatically induced concepts) and then spatial relationships between these regions to build a complete image graph representation. Our method deals with different scenarios, where isolated images or groups of i...

متن کامل

HuMan vision PercePtion in built environMent Applying image-based approach for architectural cue recognition

This paper first presents a review on visual perception in the built environment and human vision simulation. Followed by the description of the Standard Feature Model of visual cortex (SFM), an architectural cue recognition model is proposed using SFM-based features. Based on the findings of the experiments it can be concluded that the visual differences between architectural cues are too subt...

متن کامل

Vers une indexation sémantique d'images dans un fonds iconographique territorialisé

Dans cet article, nous abordons nos travaux pour indexer et faire des recherches sur une base d’images telle que celle mise à notre disposition par la médiathèque de Pau. Le but est de proposer une méthode, des outils et techniques et un modèle sémantique pour identifier automatiquement des objets ayant pour nous un intérêt visuel, par exemple un clocher, une statue. Afin de mener à bien cette ...

متن کامل

Amélioration des Performances des Systèmes Automatiques de Reconnaissance de la Parole pour la Parole Non Native

Résumé Dans cet article nous décrivons une approche pour la reconnaissance automatique de la parole (RAP) non native. Nous proposons deux méthodes pour l’adaptation d’un système de reconnaissance automatique de la parole (SRAP) existant. La première se base sur la modification des modèles acoustiques par l’intègration des modèles de la langue maternelle (LM). Les phonèmes de la langue parlée (L...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2009